# test03_set.py
# - 有两个文件：/opt/a.log 和 /opt/b.log
# - 两个文件中有大量重复内容
# - 取出只有在 b.log 中存在的行(集合间的差集运算)
with open("/opt/a.log") as fr1:
    seta = set(fr1.readlines())
with open("/opt/b.log") as fr2:
    setb = set(fr2.readlines())
print(setb - seta)  # 只有在 b.log 中存在的行
print(seta - setb)  # 只有在 a.log 中存在的行
print(seta & setb)
print(len(seta | setb))  # 4